机器学习-白板推导4.2 线性分类——高斯判别模型

1. 高斯判别模型描述

Gaussian Discriminate Analysis——GDA 模型描述。

假定数据集:

数据矩阵为:

这里讨论高斯判别分析解决二分类问题,那么对于数据集, 有。数据集分成+1, -1两部分并增加以下约定:

其中,

现在用bayes公式来生成模型:

其中,是先验Prior, 是后验Posterior。

2. 高斯判别模型建立

因为是二分类问题,可以假定先验概率符合伯努利分布,.

所以,其表达式为:

我们假设两类别数据都符合高斯分布,其均值不同,但不同变量间的协方差矩阵一样,(其实协方差不一样结论也一样,只是计算复杂)因此有:

后验估计函数为:

为了推导方便,记:

那么上述函数可以表示为:

3. 参数求解

1. 求解

只有跟参数有关,对其求导得:

因为只有类别为, 式4可以简化成:

2. 求解

因为只跟部分有关, 展开后得:

式6只有后半部分跟有关,剔除前面部分并化简:

因为的,那么, 所以 (都是实数)。并且无关

进一步简化得:

求导得:

令式9为0得:

式10最后简化原因:,只有当时,累加才有用,所以

因为对称性,同理可得

3. 求解

有关的只有, 即:

同样因为要么0, 要么1,式11可以简化为:

为了简化计算,我们先计算下:

其中, 简化计算。

首先,有下列公式:

式16证明:Gradient of tr(AB)

式13对求导得:

其中是协方差矩阵。

由式18写出式12:

令其为0得两边同乘以得:

可以理解为协方差矩阵等于各自协方差矩阵的加权和。

高斯判别分析总结

  1. 首先假设先验 服从伯努利分布和似然 服从高斯分布,利用贝叶斯公式得到条件概率函数。
  2. 利用极大似然估计求解最大值参数。